메디칼타임즈

제보하기

2024년 04월 29일 (월)
로그인

2024.04.29(월) 18:30
Every HF patient matters

로그인

로그인을 하시면 메디칼타임즈의
다양한 연관서비스를 이용하실 수 있습니다. 가입 시 등록한 정보를 입력해주세요.

개인정보 보호를 위한 비밀번호 변경안내 주기적인 비밀번호 변경으로 개인정보를 지켜주세요.
안전한 개인정보 보호를 위해 3개월마다 비밀번호를 변경해주세요. ※ 비밀번호는 마이페이지에서도 변경 가능합니다.

30일간 보이지 않기

비밀번호 변경하기

전체
일반뉴스
오피니언
메타TV

학술지도 인공지능 변화에 주목…NEJM 'AI' 신설

메디칼타임즈=최선 기자대형 언어 모델(Large language model, LLM) 및 진단 전문 인공지능(AI)의 임상 활용 및 연구가 폭발적으로 증가하면서 국제학술지도 변화 수용에 나섰다.각종 학술대회에 AI 세션이 등장하고, 관련 연구회가 설립되면서 국제학술지 NEJM은 AI 파트를 별도의 섹션으로 독립시켜 임상 진단 사례 연구부터 인공지능을 활용하기 위한 정책 코너까지 다룬다는 계획이다.24일 의학계에 따르면 국제학술지 NEJM은 AI 섹션을 별도로 독립시켜 의료 AI에 대한 전문적인 활용성 검증에 나섰다.영상, 심전도 기반의 진단 AI의 진단율이 전문의를 앞지르거나 초기 빠른 위험도 판단으로 응급환자의 초동 대처 시간을 줄였다는 긍정적인 연구 결과들이 축적되면서 의학계에는 말그대로 AI 연구 광풍이 불고 있다.실제로 내분비학회 빅데이터위원회는 'ChatGPT와 의료'를 주제로 세미나를 개최하고 대화형 인공지능 기술을 의료 분야에서 활용하기 위한 방법론을 공유한 바 있다.NEJM이 신설한 AI 특화 학술지 홈페이지 화면(ai.nejm.org)각종 학술대회에서도 ChatGPT 활용법 강좌, 강의가 속속 개설되고 AI 연구회가 신설되는 등 변화는 현재 진행형.국제의학저널편집자위원회(ICMJE)가 인공지능 사용 여부의 투명한 공개를 조건으로 연구에 활용 가능하다고 명시하자 대한내과학회지 KJM 역시 연구 및 출판윤리를 개정, AI 활용에 연구의 투고 규정을 신설했다.대형언어모델 ChatGPT이 공개된 이후 이를 활용한 연구가 전세계적으로 급증하면서 다양한 학회들도 이에 대한 기준을 마련하기 위해 팔을 걷은 바 있다.그간 AI의 가능성에 주목한 NEJM도 AI 특화에 방점을 찍었다. 그간 토픽 항목에서 '의료분야에서의 AI'를 개설해 다뤘지만 한발 더 나아가 AI만을 전문적으로 다루는 페이지(ai.nejm.org)를 신설한 것.NEJM AI는 AI의 임상 적용을 평가하기 위해 NEJM의 엄격한 연구 및 출판 표준을 적용하고 임상의와 기술 전문가가 함께 참여하는 최초의 출판물이다.NEJM AI는 ▲의료 AI 분야의 선도적인 임상의, 과학자, 기업가들의 커버스토리 ▲AI 시스템의 임상적 평가 방법 ▲의사 결정 및 관리 작업을 위한 AI 및 LLM(대형 언어 모델) 적용 방법 등을 다루게 된다.AI 전문 학술지를 표방한 만큼 AI 임상시험 설계, 진단, 환자 커뮤니케이션 및 의료 AI 애플리케이션의 임상 시험에 대한 연구 보고서뿐 아니라 데이터 세트, 벤치마크 및 프로토콜과 같은 알고리즘 구축 및 검증 도구에 대한 전문적인 내용도 다룬다는 계획.이와 관련 앤드류 빔 NEJM AI 창간 부편집장은 "의료 AI에서 무엇이 효과가 있고 무엇이 효과가 없는지에 대한 기록 저널이 되겠다"고 창간의 목적을 설명했다.'ChatGPT와 의료'를 주제로 세미나를 개최한 김헌성 내분비학회 빅데이터이사는 "인공지능 기술이 의료 분야에서 새로운 혁신을 이끌고 있다"며 "의사들이 ChatGPT에 많은 관심을 가지고 있지만 관심의 크기와는 다르게 실제로 어떻게 활용하는지 아는 사람은 많지 않다"고 말했다.임상 분야에서도 AI 활용에 대한 수요 및 검증이 꾸준한 만큼 이와 관련된 전문 학술지의 태동이 임상 현장과 AI의 접목에 마중물이 될 수 있다는 게 전문가들의 전망이다.

2024-01-25 05:30:00학술

기획 창간 20주년 특별기획

신기루냐 신기술이냐…Chat GPT 등장에 분주한 의학계

메디칼타임즈=최선 기자"단일 주제에 최단 기간 이렇게 많은 관심이 집중된 건 처음입니다."2022년 11월 말 첫 등장한 대화형 인공지능 ChatGPT가 의료계 화두로 떠오른 건 올해 1월 미국 의사면허 시험(USMLE)을 통과했다는 소식이 알려지면서부터다. 인공지능이 체계화된 학습과 고도의 사고 능력, 전문성을 살피는 의사면허 시험을 통과한 것은 상징적인 사건이라는 게 전문가들의 평. 실제로 7월 2일 기준 논문검색 사이트 PubMed에 등록된 ChatGPT 관련 연구 논문은 총 723편으로 단기간 최대의 관심이 ChatGPT에 집중되고 있다고 해도 과언이 아니다. 산술적으로 계산하면 ChatGPT의 등장 이후 의료 영역 활용성과 접목 가능성을 살핀 연구는 한달에 100편 꼴로, 이는 단순한 흥미끌기용이 아닌 본격적인 의료 영역에서의 검증의 시험대에 올라섰음을 의미한다.이런 현상은 외국에 국한되지 않는다. 국내에서도 ChatGPT의 활용성을 검증한 논문이 출현하고 있는 데다가 각종 학술대회에서도 연구/논문 작성을 위한 최적화된 ChatGPT 활용 방법론 세션이 속속 등장하고 있다.1990년대 중후반부터 의학 연구에서도 의학통계 분석 프로그래밍 언어 SPSS 학습이 대중화된 것처럼 ChatGPT는 지나가는 한때의 유행으로 치부하기엔 기술적인 완성도가 상당해, 비슷한 맥락에서 "모르면 뒤쳐진다"는 평가가 나오고 있다.흥미로운 점은 주요 연구들이 인공지능을 두고 친구/적/혁명/바보(ChatGPT: friend or foe?, ChatGPT is fun, but not an author, ChatGPT fool scientists, ChatGPT: evolution or revolution?)와 같은 이분법적인 구도로 접근한다는 점.실제 ChatGPT를 써 본 의학자들은 평가는 어떨까. ChatGPT와 같은 인공지능 기술이 병원이나 의료 영역에서 다양한 방식으로 활용되는 것이 예정된 미래라면 과연 어떤 분야에서 어떻게 활용될 수 있을까. 전문가에게 미래 병의원의 ChatGPT 활용성에 대해 질의하자 다음과 같은 답변이 돌아왔다.-의료 진단 및 상담: ChatGPT는 환자들의 증상 및 의료 기록과 관련된 질문에 대답할 수 있습니다. 의사나 간호사가 바쁜 상황에서, ChatGPT는 환자들에게 기본적인 질문에 응답하거나 증상에 대한 일반적인 정보를 제공하는 역할을 수행할 수 있습니다. 또 ChatGPT는 환자들의 심리적인 문제나 스트레스에 대한 상담을 제공할 수도 있습니다.-의료 정보 제공: ChatGPT는 의료 정보를 제공하는데 활용될 수 있습니다. 환자들이 특정 질병이나 의료 절차에 대해 궁금한 사항이 있을 때, ChatGPT는 해당 정보를 제공하고 관련 자료나 추천을 할 수 있습니다. ChatGPT는 의료 용어나 의학적인 개념에 대한 설명을 담당해 환자들이 이해하기 쉽도록 도와줄 수 있습니다.-의료 연구 지원: ChatGPT는 의료 연구자들의 작업을 지원하는데 활용될 수 있습니다. 의료 연구에는 방대한 양의 데이터와 문헌 조사가 필요한데, ChatGPT는 이러한 작업을 자동화하거나 보조할 수 있습니다. 예를 들어 ChatGPT는 의료 문헌을 분석하고 연구 결과를 요약하거나 관련 연구 자료를 추천할 수 있습니다.-환자 모니터링: ChatGPT는 환자들의 건강 상태를 모니터링하는데 활용될 수 있습니다. ChatGPT를 통해 환자들은 의료진과 실시간으로 대화하며 건강 상태를 보고하고 조언을 받을 수 있습니다. ChatGPT는 환자들의 건강 데이터와 의료 기록을 분석해 변화나 이상 징후를 감지하고 조기 경보를 제공할 수 있습니다.-의료 교육: ChatGPT는 의료 교육에 활용될 수 있습니다. 의사들이나 의료 학생들에게 의료 지식을 가르치거나 의료 교육 자료를 제공하는데 사용될 수 있습니다. 또 ChatGPT는 환자 교육을 위해 의료 정보를 이해하기 쉽고 친근한 언어로 전달하는 역할을 수행할 수 있습니다.결론부터 말하자면 위 활용성에 대한 답변은 ChatGPT가 언급한 내용이다. 인공지능 답변의 영향을 배제하기 위해 전문가들의 취재를 마친 이후 같은 내용을 ChatGPT에 대해 질의했다. 흥미로운 점은 ChatGPT가 스스로 판단한 미래 병의원에서의 활용성은 놀라울 정도로 의료 전문가가 상상한 미래, 혹은 진행되고 있는 상용화 방향과 닮아있었다.7월 2일 기준 논문검색 사이트 PubMed에 등록된 ChatGPT 관련 연구 논문은 총 723편으로 매달 100여편씩 활용성을 검증이 지속되고 있다.현재 ChatGPT를 의료 영역에 접목하기 위해 시도하고 있는 의료기관들은 문진, 진료 결과 안내, 연구 지원과 같은 분야에서 우선적으로 ChatGPT를 활용하는 방향성으로 접근하고 있다. 행정, 단순 업무에 대한 활용을 시작으로 그 범위를 늘려간다는 것. 실제 전문가들에 대한 의견을 들어보자.▲신기루냐? 신기술이냐? "미래 환경 바꿀 키(key)"ChatGPT를 두고 친구/적/혁명/바보와 같이 극단적으로 평가가 엇갈리는 이유는 단순하다. 그간 의료계를 강타했던 빅데이터, AI, AR, VR, 블록체인 등 다양한 신기술들이 혁명은 커녕 활용성을 찾지 못해 신기루에 그쳤던 것. 양극단의 평가는 그 전철을 밟을 것이란 우려와 이번엔 다르다는 긍정론의 교차를 의미한다.대규모 수술 참관, 술기 반복 학습 등 교육 혁신으로 일컬어졌던 VR 시스템 및 메타버스는 불과 1년 전만해도 각종 의료기관이 앞다퉈 도입 소식을 알렸지만 현재는 메타버스를 활용한 교육 진행은 커녕 보도자료에서도 해당 단어가 자취를 감출 정도로 '한때 유행'으로 전락했다.메타버스는 새로운 정체성과 자아를 가진 캐릭터들이 모여 새로운 가상 공간을 창조하고 이용한다는 신기함이 있을지언정, "그래서 의료계에서 활용성은?"이란 질문 앞에 적절한 당위성을 제공하지 못했기 때문이다.ChatGPT도 한때 유행에 그칠까. 아니면 미래 환경을 바꿀 핵심일까. 조치흠 대한의료정보학회 조직위원장(계명대 동산의료원장)의 판단은 후자에 가깝다.조 위원장은 "ChatGPT는 스마트병원을 완성시킬 핵심 키"라며 "2019년 이전 개원한 동산병원도 스마트병원을 만들기 위해 원무 자동화 시스템, 웨어러블 디바이스, 로봇 물류 시스템, 실시간 감염추적관리 시스템, 보이스 채팅 등을 도입하고자 노력하고 있다"고 말했다.그는 "기계와 인간은 서로 잘하는 영역이 다르다"며 "기계는 단순하고 반복적인 일을 잘하고, 인간은 고도의 사고를 바탕으로 각 개별 환자의 상황에 맞는 질문, 환자 상태에 대응하는 일에 특화돼 있는데 문제는 현재 의료기관의 가장 큰 문제점은 의료진이 타이핑 등 반복적이고 단순한 일에 할애하는 시간이 너무 많다는 것"이라고 지적했다.의사가 차트에 환자 상태를 기록하고, 처방을 내리는 행정적 절차에 얽매이다 보니 정작 환자의 눈을 마주보며 대화하고 개별 환자에 적합한 의료적 상담을 제공할 여유가 없다는 것. 간호사들 역시 바이탈 사인 체크, 환자 안내 등의 반복적인 업무 비중이 높아 의료진의 '기계적인 대응'이 나올 수 밖에 없다는 진단이다.조치흠 대한의료정보학회 조직위원장조 위원장은 "병원에 처음 온 환자, 특정 질병을 첫 진단 받은 환자는 어디로 가서, 어떤 절차로 약을 처방받는지, 질병에 대한 올바른 접근법은 뭔지, 발병 원인은 무엇인지 질문이 꼬리에 꼬리를 문다"며 "의료진들이 이에 적절히 대응하고 싶지만 행정적 절차가 너무 많아 다 대응할 수 없는 아쉬움이 있다"고 밝혔다.그는 "내년 10월을 목표로 문진 시스템과 ChatGPT의 접목을 시도하고 있다"며 "ChatGPT는 실시간 언어 모델이기 때문에 어르신들이 어려워하는 키오스크와 달리 진입 장벽없이 환자가 대화로 물어봐도 인간과 유사한 수준으로 답변을 해 준다"고 강조했다.이어 "음성 기반의 EMR이 상용화되고 있기 때문에 곧 고도화된 보이스 EMR이 병의원의 필수 시스템으로 자리잡지 않을까 한다"며 "ChatGPT와 연동까지 된다면 상당량의 의료 행정 업무에서 해방돼 타이핑을 치느라 환자 눈을 볼 시간도 없는 의료진이 보다 환자 진료에 집중할 수 있게 될 것"으로 전망했다.이는 "의사나 간호사가 바쁜 상황에서 ChatGPT는 환자들에게 의료 기록과 관련된 질문에 응답하거나 증상에 대한 일반적인 정보를 제공할 수 있다"는 ChatGPT의 답변과 같다. 최고의 의료와 최첨단 스마트 플랫폼, 그리고 AI가 융합된 스마트병원은 효율성을 기반으로 오히려 인술을 펼치기 위한 따뜻한 교감이 가능해진다는 것.스마트화를 통해 의료진들이 본인 역량을 환자에게 더욱 집중할 수 있도록 구조화하는 것이 사람과 사람이 교감하는 환자 중심의 감성병원으로 발전하는 핵심이기 때문에 행정 업무의 효율화 방향으로 ChatGPT의 우선 접목시도가 이뤄질 것이라는 게 그의 판단이다.실제로 의료정보학회는 올해 춘계학술대회 주제로 'Revolution and Innovation in Smart Healthcare'를 선정, ▲ChatGPT 초보자를 위한 연구 활용법 ▲의료정보/인공지능의 임상적용 ▲의료영상 인공지능 ▲머신러닝 기술 개발 및 적용 ▲초거대 AI의 의료분야 적용방안 ▲의료인공지능의 미래를 위한 인재양성 방안 ▲의료분야에서의 자연어처리 및 ChatGPT 기술의 적용과 미래 전망 ▲Vision 기반 Medical AI 기술과 초거대 AI로 인한 변화 방향 등의 세션을 전진배치헸다.▲접목 시도는 현재진행형…"행정 업무 효율화에 최적"김종엽 건양대의료원 교수(이비인후과)는 의료계에서 '데이터사이언티스트'로 꼽힌다. 프로그래밍 언어 습득을 기반으로 아이폰 앱을 개발한 것은 물론 건양대 헬스케어데이터사이언스센터장, 의료정보부실장으로 활동하며 기술이 가져올 의학계의 변화를 조망하고 있다.보건복지부와 데이터 네트워크 인공지능 중장기 국가전략 및 실행계획을 수립하고, 대통령 직속 4차산업혁명위원회에서 디지털 헬스케어 특별위원회 위원을 맡는 등 의료인공지능 발전과 인프라 조성에 노력한 공로로 작년 '과학·정보통신의 날'에 국무총리 표창을 받은 바 있다. 그가 판단한 ChatGPT는 의료진의 궂은일을 떠앉는 조력자다.김 교수는 "의료진을 포함해서 미디어, 제약사, 의료기기업체, 보건당국까지 의료 현장에서 어떻게 ChatGPT를 접목하고 활용할 수 있냐는 질문이 빈번하게 나온다"며 "현재 ChatGPT는 의료쪽에 특화된 모델은 아니기 때문에 추가 학습을 시켜 적절한 튜닝을 하면 기능이 올라간다"고 강조했다.임상 의료기관과 ChatGPT의 접목을 시도하는 전문가들은 대화형 인공지능의 활용이 문진 및 의료 데이터 요약 등 행정 업무 효율화를 위주로 점차 확대될 것으로 전망했다.(자료사진)그는 "현재 모델에 병원 데이터가 합쳐지면 ChatGPT의 궁극의 장점으로 꼽히는 문헌 검색과 요약에서 굉장한 힘을 발휘할 것으로 본다"며 "각 대형 의료기관마다 의무기록이 쌓여서 특정 정보를 찾는게 힘든데 이제 그런 수고를 언어 모델인 ChatGPT가 대신하지 않을까 한다"고 전망했다.그는 "포탈 사이트에서 만든 음성 인식 앱이 높은 인식률을 기반으로 많이 쓰이고 있는데 이를 텍스트 입력 기반의 ChatGPT와 결합하면 굉장한 시너지가 예상된다"며 "이를 테면 환자와 의사의 대화를 ChatGPT가 듣고 기록한 후 여기에서 처방 데이터를 추출해서 자동으로 처방전을 만들어주는 상황을 그려볼 수 있다"고 설명했다.음성 기반의 ChatGPT가 상용화된다면 의료진은 텍스트 기반의 데이터 확인, 생성에 시간을 아낄 수 있어 환자 진료에 보다 집중할 수 있게 된다는 것. 이 역시 "의료(연구)에는 방대한 양의 데이터와 문헌 조사가 필요한데, ChatGPT는 이러한 작업을 자동화하거나 보조할 수 있다. 예를 들어 ChatGPT는 의료 문헌을 분석하고 연구 결과를 요약하거나 관련 연구 자료를 추천할 수 있다"는 ChatGPT의 언급과 일치한다.건양대병원은 이런 장점을 근거로 의료기관 행정 효율화 영역에서 ChatGPT 도입 여부를 검토중이다.김 교수는 "ChatGPT를 도입해 의료기관에 적합하게 파인 튜닝(fine tunning)할지, 아니면 자체 개발할지 고민하고 있다"며 "인공지능이라고 해도 요즘은 오픈소스 방식이 많아 자체 개발도 가능한 수준"이라고 말했다.그는 "문진 과정에서 환자의 관심 키워드를 자동으로 포착해 의료진에게 전달하는 문진과 의무기록이 합쳐진 방식을 고려하고 있다"며 "기존의 상용화된 보이스 EMR 등의 솔루션은 생각보다 기대에 못 미쳐 활용도가 떨어졌지만 대규모 언어 모델 인공지능은 맥락을 이해하고 요약하는 능력이 강력해, 심도있게 도입 방안을 고민하고 있다"고 덧붙였다.▲거짓말에 능숙한 인공지능…의료 영역 활용 위한 과제는?긍정론에도 불구하고 메타버스와 같이 한때의 유행이나 제한적 활용에 그칠 것이란 전망도 나온다.학습 데이터를 기반으로 하는 만큼 얼마나 양질의 데이터를 제공하고 학습시키느냐가 의료적 활용도를 결정하고 부정확한 정보를 능숙한 거짓말로 만들어내는 환각(hallucination) 특성상 행정 영역에서 제한적 활용만 가능할 것이란 진단이다. 환자 생명에 직결된 내용을 잘못 고지할 경우 이를 활용한 의료진, 의료기관의 책임소재 문제도 불거질 수밖에 없기 때문이다.언어 모델 인공지능은 그 특성답게 환자 안내, 문진, 의료 정보 취합, 환자 상담 요약에 강점이 있어 진단 영역에서는 진단에 특화된 전문 인공지능이 사용될 것이라는 것. ChatGPT가 모든 의료적 문제를 해결하는 '만능 키'가 아니라는 뜻이다.김대진 가톨릭중앙의료원 정보융합진흥원장(서울성모병원 정신건강의학과 교수)은 "처음엔 메타버스 회의가 신기해서 많이 시도됐지만 지금은 자취를 감췄다"며 "ChatGPT가 그런 전철을 밟을 것인지에 대해선 회의적"이라고 말했다.그는 "ChatGPT의 등장은 고작 반년을 지났기 때문에 현 시점에서 상용화를 진단하는 것은 성급하지만 우선은 ChatGPT는 언어에 강점이 있어 활용성은 언어 모델 위주로 판단해야 할 것 같다"며 "마이크로소프트가 음성 인식 헬스케어업체 뉘앙스(Nuance)를 인수하고 ChatGPT를 결합하는 등 의료 영역 고도화에 나섰다"고 밝혔다.김대진 가톨릭중앙의료원 정보융합진흥원장그는 "뉘앙스 AI에 환자와 정신과 의사의 대화를 들려준 뒤 무슨 약을 써야 하는지, 치료 스케쥴을 어떻게 해야 하는지 계획을 짜 달라고 하자 전문가가 보기에도 굉장히 수준 높은 답변이 나왔다"며 "메타버스는 실용성이 떨어져 없어도 그만이었지만 ChatGPT는 다르다"고 강조했다.검진 데이터를 ChatGPT가 요약해 준다면 전문의가 같은 시간 동안 더 많은 데이터를 읽고 판독해 더 많은 검진 결과를 산출해 내는 등 실제 업무 효율화에 기여할 수 있다는 것.김대진 원장은 "로봇수술할 때 화면을 3D로 구현해 주는 프로그램이나 영상의학 판독에 특화된 AI 등 각 과 특성에 맞는 AI 분석 모델을 구입해달라고 한다"며 "이런 개별화된 솔루션과 ChatGPT를 합치면 업무 효율과를 기대할 수 있다"고 전망했다.그는 "ChatGPT를 만능으로 본다면 실망하겠지만 각 유틸리티를 연결하는 통로로 본다면 활용성은 무궁무진하다"며 "딥러닝 모델과 연계해 심혈관 질환 급성사망 확률이 70% 이상일 때 약을 미리 처방하게끔 한다든지 활용 방안이 많다"고 덧붙였다.어디까지나 의료진의 업무 효율 증대 목적에 ChatGPT의 활용성이 있는 만큼 이를 너무 경계하거나 확대해석할 필요가 없다는 것. AI의 활용성과 확장성은 결국 이를 이용하고 소비하는 의료인의 손에 달려있다는 뜻이다.아주대의대 병리학교실 김석휘 교수가 진행한 ChatGPT의 의사 인력 대체 가능성을 점검한 연구 논문(doi.org/10.3904/kjm.2023.98.3.99)은 ChatGPT를 의료진의 의사 결정을 돕는 유틸리티로 봤을 뿐 의사를 대체할 '적'으로 보진 않았다.김 교수는 "미충족 수요가 너무 높고 의사가 수행하는 것이 불가능한 일이라면, 해당 영역에서 AI를 활용할 수 있다"며 "예를 들어 전혈구 계산은 임상적 주요 결정에 꼭 필요하지만 사람이 세기 어렵기 때문에 기계의 힘을 빌려 정확히 셀 수 있고, 이러한 기능이 검증된다면 의사는 그 결과를 믿고 이에 기반해 결정할 수 있다"고 강조했다.그는 "의사가 하기 어렵지만 기계로는 빠르고 정확하게 할 수 있고, 이 결과를 의사가 점검 후 최종 판단을 하는 경우에도 해당 모델은 의사의 역할과 의료의 범주를 더 확장해 주는 것"이라며 "반면에 의사가 어렵지 않게 할 수 있는 일이고, 굳이 다른 방법론의 도움이 필요하지 않다면 수요도가 떨어지기에 진료 현장에 들어오기 어려운 모델이 될 것"이라고 관측했다.이마저도 "ChatGPT는 환자들의 건강 상태를 모니터링하는데 활용될 수 있고 환자들의 건강 데이터와 의료 기록을 분석해 변화나 이상 징후를 감지하고 조기 경보를 제공할 수 있다"는 ChatGPT가 스스로 예측한 활용성과 그 비전을 공유하는 셈이다.

2023-07-03 05:30:00학술

표절과 창작 경계는? 늘어나는 AI 활용 연구 기준 마련 분주

메디칼타임즈=최선 기자최근 실시간 대화 기반의 대규모 인공지능(AI) 모델 ChatGPT를 연구에 활용하는 사례가 늘면서 학술적 활용 기준 마련 작업이 본격화될 전망이다.AI모델로 생성한 그림, 음악, 소설 등의 컨텐츠에서 창작 주체 및 표절, 소유권 논란이 불거진 만큼 의학적 연구에서 AI 활용 여부 명시 및 이에 따른 저작자의 책임이 필요하다는 것.일부 해외 학술기관들이 AI 연구 기준을 마련한 가운데 국내 의학한림원도 기준 마련에 팔을 걷었다.21일 의학한림원에 따르면 연구윤리를 관장하는 윤리위원회 분회에서 의학 연구 분야에서의 ChatGPT 등을 포함한 AI 활용 기준 마련에 착수했다.2022년 11월 등장한 대화형 인공지능 ChatGPT는 아이디어 생성 및 개념 유추, 문헌 검토 수행, 교정 및 편집 제공 등의 기능으로 벌써부터 임상 영역에서의 활용 가능성이 검토된 바 있다.국제의학저널편집자위원회(ICMJE)는 AI 활용 항목을 신설하고, AI 사용 시 사용 여부, 범위 고지 의무 및 저작자에 대한 책임을 명시했다.다양한 범위에 걸쳐 고품질의 연구 관련 질문을 생성하거나 연구자에게 참신한 아이디어를 제공하는 사례가 보고되면서 실제 다양한 학회들이 ChatGPT 활용법 강좌, 강의를 학술대회에서 선보이고 있다.이에 국제의학저널편집자위원회(ICMJE)는 이달 초 ChatGPT를 포함한 AI 모델의 활용 여부 명시에 대한 규정을 신설하고 공개했다.ICMJE는 "저널은 저자가 제출된 작업 제작에 대형 언어 모델(LLM), 챗봇 또는 이미지 생성기 등 AI 지원 기술을 사용했는지 여부를 공개하도록 요구해야 한다"며 "해당 기술을 사용한 경우 저자는 기술을 어떤 범위에 걸쳐 어떻게 사용했는지 커버레터 등에 설명해야 한다"고 규정했다.이어 "ChatGPT와 같은 챗봇을 쓸 경우 작업 결과의 정확성, 무결성 및 독창성에 대해 책임을 질 수 없기 때문에 관련 책임은 저작자가 진다"며 "연구자는 AI가 부정확하거나 불완전하거나 편향된 결과를 생성할 수 있으므로 결과를 신중하게 검토하고 편집해야 한다"고 당부했다.이에 따르면 연구자는 AI 기술 사용 시 사용 여부만 표기해야 하고 AI를 저자나 공동 저자로 표기할 순 없다. 또 AI가 생성한 텍스트와 이미지, 인용에서 표절이 없다는 부분을 확인하고 관련 책임을 지도록 했다.한림원도 활용 범위를 명시한 기준을 마련한다는 방침이다.양철우 한림원 윤리위원장은 "실제로 ChatGPT를 사용해 대학교 과제물을 제출했다는 소식이 나오고 있다"며 "연구에서도 AI의 활용성 보편화되고 늘어날 것으로 전망되기 때문에 이에 대한 기준이 필요하다"고 밝혔다.그는 "ChatGPT를 어느 범위에서 어디까지 이용했다는 이런 식의 구체적인 내용 고지가 없으면 이른바 '복사 붙여넣기' 수준의 연구도 가능할 수 있다"며 "연구에서의 AI 활용 관련 내용을 추가한 연구 가이드라인을 만들겠다"고 말했다.한림원도 AI 활용 시 사용 내역 명시, 결과물에 대한 저자 책임 규정 등으로 구체화할 전망이다. 올해 안 가이드라인 완성을 목표로 하지만 연구 분야에서 ChatGPT가 핫한 트렌드로 떠오르고 있어 권고문 형태로 먼저 방향성을 제시할지 내부 검토중이다.양 위원장은 "윤리위원들도 AI 문제 가능성에 대해 인식만 할뿐 아직 구체적인 방향, 방법론이 설정된 것은 아니기 때문에 내부 의견을 종합하는 과정을 거쳐야 한다"며 "내달 디지털임상의학회 창립 총회에 여러 학술지 편집장들이 모이기 때문에 그 자리를 빌어 의견을 교환, 지침의 방향성을 구체화하겠다"고 덧붙였다.

2023-06-22 05:30:00학술

같은 의사들도 인정한 Chat GPT…"의사 답변보다 낫다"

메디칼타임즈=이인복 기자환자들이 의사에게 묻는 대부분의 질문에 대해 의사들의 답변보다 대화형 인공지능인 Chat GPT가 오히려 낫다는 평가가 나왔다. 실제 의사들의 평가라는 점에서 의미가 있는 부분.이에 따라 향후 원격의료 등에서 단순한 의학적 질문 등에 Chat GPT를 충분히 활용할 수 있다는 것이 전문가들의 결론이다.Chat GPT와 의사의 답변을 실제 의사들이 직접 평가한 연구 결과가 나왔다.현지시각으로 2일 미국의사협회지(JAMA)에는 환자의 질문에 대한 의사의 직접 답변과 Chat GPT의 답변을 비교 평가한 연구 결과가 게재됐다(10.1001/jamainternmed.2023.1838).현재 대화형 인공지능인 Chat GPT의 우수한 성능이 공개되면서 각 학계에서는 이에 대한 실제적 기능에 대한 평가가 활발히 이뤄지고 있다.특히 Chat GPT가 미국 의사시험은 물론 변호사시험 등을 무난하게 통과하면서 과연 실제 현장에서 이를 활용할 수 있을지에 대한 검증이 이뤄지고 있는 상황.캘리포니아 의과대학 존(John W. Ayers) 교수가 이끄는 연구진이 실제 Chat GPT를 활용한 환자 대응의 가능성을 점검하고 나선 것도 이러한 이유 때문이다.실제로 Chat GPT가 의사의 로딩을 줄이고 환자의 건강관리 등에 활용될 수 있는지를 파악하기 위해서다.이에 따라 연구진은 환자가 의사에게 자주 묻는 총 195가지의 질문 목록을 만들고 이에 대한 실제 의사의 답변과 Chat GPT의 답변을 비교 분석했다. 어떤 것이 의사의 답변인지, Chat GPT의 답변인지 모르는 블라인드 테스트다.의사의 답변과 Chat GPT의 답변에 대해 소아과와 내과, 종양내과, 감염내과, 예방의학과, 노인내과 전문의들이 직접 적합도와 정확성 등을 답변만 보고 5점 척도(매우 나쁨, 나쁨, 수용 가능, 좋음, 매우 좋음)로 평가한 것.그 결과 일단 의사의 답변보다 Chat GPT의 답변이 훨씬 더 자세했다. 답변에 대한 평균 길이를 비교하자 의사는 52개의 단어에 그친 반면 Chat GPT는 무려 211개의 단어를 활용해 자세히 답변한 것.그렇다면 이에 대한 정확도와 적절성 등 답변의 품질은 어떠한 평가를 받았을까.이 또한 Chat GPT가 더 우수한 평가를 받았다. 전문의 패널이 의사의 답변과 Chat GPT의 답변의 답변 정확도와 품질을 5점 척도로 평가한 결과 의사의 응답은 평균 3.26점에 그친 반면 Chat GPT는 평균 4.13점으로 유의하게 앞선 것.특히 수용 가능하지 않은 정도의 잘못된 정보나 품질(3점 미만)의 답변으로 평가받는 비율도 의사는 27.2%에 달했지만 Chat GPT는 2.6%로 월등하게 적었다.더욱이 특별히 더할 것이 없이 매우 좋다(4점 이상)는 평가를 받은 답변의 비율 또한 의사는 22.1%에 불과한 반면, Chat GPT는 무려 789.5%로 압도적으로 높았다.이로 인해 답변에 공감하고 수용할 수 있다는 평가도 오히려 의사보다 Chat GPT의 손을 들어준 전문의들이 많았다.공감도 또한 5점(매우 공감하지 않음, 공감하지 않음, 공감함, 약간 공감함, 매우 공감함) 척도로 평가한 결과 의사의 응답은 평균 2.15점을 기록한 반면 Chat GPT는 3.65점으로 의사의 답변을 앞섰다.아울러 공감하기 힘들다(3점 미만)의 답변의 비중도 의사는 80.5%에 달한 반면, Chat GPT는 14.9%로 유의미하게 적었다.실제 관련 분야 전문의들조차 의사가 직접 답변한 내용보다 Chat GPT의 답변이 더 정확하고 품질이 좋으며 공감할 수 있다는 결론을 내린 셈이다.존 교수는 "대부분의 질문에 있어 관련 분야 전문의들은 실제 의사의 답변보다 Chat GPT의 답변이 더 정확하고 공감대가 가며 품질이 좋다는 답변을 내놨다"며 "Chat GPT가 가진 한계론에도 불구하고 이를 활용할 수 있는 충분한 근거가 있다는 것을 시사한다"고 설명했다.그는 이어 "물론 환자에 대한 진단과 약물의 조절 등의 중요한 부분에 대해서는 반드시 의사의 최종적 판단이 우선시 돼야 한다"며 "하지만 Chat GPT가 내놓은 답변을 의사가 검수하는 등의 방법으로 의사의 로딩을 크게 줄일 수 있을 것"이라고 밝혔다.

2023-05-03 05:30:00의료기기·AI

"모르면 뒤쳐진다"…의학계도 ChatGPT 배우기 열풍

메디칼타임즈=최선 기자대화 기반의 인공지능 모델 ChatGPT의 의료 영역 활용 가능성에 대한 검증 작업이 본격화되고 있는 가운데 이와는 별도로 의학계의 ChatGPT 활용법 익히기 역시 활성화될 전망이다.의학회 학술대회 세션 중 하나로 빅데이터 분석 방법이 활성화되고 그에 따라 다양한 후향적 분석 연구가 폭발적으로 증가한 것과 마찬가지로 ChatGPT 활용법을 익혀야만 새 인공지능 툴을 이용한 파생 연구를 진행시킬 수 있기 때문.특히 빅데이터를 다루는 학회를 중심으로 ChatGPT 활용법 강좌, 강의가 속속 개설되고 있다는 점에서 데이터 분석을 위한 기초 강의로 자리잡을 가능성도 제기된다.25일 내분비학회 빅데이터위원회는 'ChatGPT와 의료'를 주제로 세미나를 개최하고 대화형 인공지능 기술을 의료 분야에서 활용하기 위한 방법론을 공유했다.내분비학회 빅데이터위원회가 기획한 ChatGPT 관련 세미나작년 말 등장한 ChatGPT는 등장과 함께 인간을 방불케하는 고도화된 대화 및 각 분야에서 전문가 수준의 답변으로 이슈가 된 바 있다.2021년까지 학습된 데이터를 기반으로 '적절한 질문'을 할 경우 다양한 범위에 걸쳐 고품질의 연구 관련 질문을 생성하거나 연구자에게 참신한 아이디어를 제공하는 사례가 보고되고 있다. 문제는 '적절하지 않은 질문'을 할 경우에는 엉터리 답변을 내놓는 등 그 신뢰성과 활용도가 크게 저하된다는 점. 적절하게 사용하는 방법을 알아야만 고품질의 데이터를 확보할 수 있다는 뜻이다.김헌성 내분비학회 빅데이터이사는 "인공지능 기술이 의료 분야에서 새로운 혁신을 이끌고 있다"며 "ChatGPT는 대화형 인공지능 기술의 대표적인 모델로서 의료 분야에서도 많은 활용 가능성이 있어 이에 세미나를 기획했다"고 밝혔다.그는 "의사들이 ChatGPT에 많은 관심을 가지고 있지만 관심의 크기와는 다르게 실제로 어떻게 활용하는지 아는 사람은 많지 않다"며 "전반적으로 ChatGPT가 무엇인지, 어떻게 활용할 수 있는지 알려달라는 요청이 꾸준히 있었다"고 설명했다.그는 "사실 신기술에 대해선 관대하기 마련이고 너무 장미빛으로 보는 시선도 있다"며 "학습된 자료를 되폴이하거나 요약하는 정도에 그칠 수도 있기 때문에 AI를 맹신하기 보다는 어떻게 하면 이런 맹점을 조심하면서 의료영역에서 활용할 수 있는지 확인하는 자리가 될 것"이라고 소개했다.세미나는 ▲의료분야에서의 ChatGPT의 역할과 미래 ▲ChatGPT의 돌풍 근거 ▲ChatGPT 활용법에 걸쳐 성균관대 삼성융합의과학원 교수부터 빅데이터위원회 소속 임원 4명을 패널로 내세워 잠재력과 한계를 동시에 진단한다.김 이사는 "특히 인공지능은 결론이 나올 뿐 그 결론이 도출되기까지의 과정이 블랙박스로 남아있기 때문에 결과를 무조건 맹신해선 안 된다"며 "알고리즘에 대한 이해를 통해 결론 인용에서 조심해야 할 부분, 결과에 대한 적절한 비판적 사고 등을 함양할 생각"이라고 덧붙였다.신경학회 스마트헬스케어연구위원회가 개설한 심포지엄 및 강연 목록대한신경과학회도 신경계질환 스마트헬스케어연구위원회 심포지엄을 통해 신경계 질환 연구에서 AI 활용방안 모색에 나섰다.신경과학회 관계자는 "스마트헬스케어연구위원회 심포지엄 신청을 5월 10일까지 받는다"며 "디지털치료제에서의 AI역할, 의지할만한 인공지능과의 협업 프레임워크 등에 대해 강의하게 된다"며 "연세대학교 컴퓨터과학과 교수를 초빙해 ChatGPT 관련 원리 및 의료 분야 활용 방안에 대해 들을 수 있는 자리를 마련했다"고 밝혔다.ChatGPT의 의료 영역 활용 가능성이나 신뢰성을 검증하는 연구가 폭발적으로 증가하고 있지만 아직 다수의 임상 전문가들은 ChatGPT 존재를 모를 뿐더러 활용 방법 또한 모르기 때문에 심포지엄을 통해 인식을 제고하겠다는 것이 학회 측의 계획.실제로 의학 논문검색 사이트 PubMed에 챗GPT 관련 연구가 첫 등장한 2022년 12월을 기점으로 4월 25일 현재 관련 논문은 총 309건이 등록된 상태다. 약 한달 전 관련 연구가 140여건이었다는 점에서 한달만에 배가 넘는 연구가 쏟아져 나온 셈. 이는 코로나19 팬데믹 관련 연구 이후 가장 폭발적이라는 게 의학계 관계자들의 판단이다.지난달 개최된 대한보건의료정보관리사협회의 '보건의료 상병데이터 큐레이션 교육'에서도 디지털 헬스의 모습을 주제로 디지털 전환, 초연결과 의료 마이데이터, 초지능과 AI, ChatGPT 활용방안과 사례를 소개한 바 있다.

2023-04-26 05:30:00학술

의학적 활용성 높이는 Chat GPT "한국에선 안맞아"

메디칼타임즈=이인복 기자대화형 인공지능 Chat GPT가 진단과 치료 방식의 결정 등에서는 전문의와 큰 차이가 없다는 연구 결과가 나왔다. 하지만 당장 임상에 적용하기에는 한계가 분명했다.전 세계를 아울러 정보를 취합하는 특성상 각국의 진료지침과 보험 정책, 인정되는 적응증 등을 반영하는데 한계가 나타났기 때문이다. 즉, Chat GPT가 우리나라에서 진료를 하면 의학적으로는 타당해도 삭감이 될 수 있다는 의미다.Chat GPT의 실제 임상 적용 가능성에 대한 분석 연구 결과가 나왔다.현지시각으로 2일 대한간학회 영문 학술지 Clinical and Molecular Hepatology에는 Chat GPT의 임상적 활용 가능성에 대한 분석 연구 결과가 게재됐다(10.3350/cmh.2023.00890).Chat GPT는 대화형 인공지능으로 상당한 정확도와 문장력, 신뢰도로 보이며 학계와 산업계에서 그 활용 가능성에 대한 연구를 진행하고 있는 상태다.특히 미국 앤서블헬스(Ansible Health)에서 시행한 연구 결과 3단계에 걸친 미국 의사시험(USMLE)을 50% 이상의 정확도를 보여주며 무난하게 통과해 의학적 활용 가능성을 인정받고 있는 상황.말 그대로 의사 면허를 딸 수 있을 정도로 발전한 인공지능이라는 점에서 실제 임상에서 활용할 수 있을지에 대한 관심이 높아지고 있는 셈이다.시더스 시나이 의료센터 알렉산더(Alexander Kuo) 박사가 이끄는 연구진이 간 질환에 대한 적용 가능성 분석에 들어간 것도 이러한 이유 때문이다. 과연 실제로 Chat GPT를 진료에 활용할 수 있을지 파악하기 위해서다.이에 따라 연구진은 간경화와 간암 등 주요 간질환을 대상으로 진단과 치료, 예방 등 총 5개 카테고리에서 164개의 질문을 던져 이에 대한 정확도와 신뢰도를 측정했다.같은 질문을 해당 전문의 3명에게 교차 검증하며 과연 현재 임상 지침 등에 부합하는지를 비교한 것이다.그 결과 Chat GPT는 164개 질문 중 무려 76.9%의 질문에 전문의와 전혀 다르지 않는 높은 수준의 정확성을 가진 정보를 제공했다. 10개 중 약 8개는 전문의와 차이가 없었다는 의미다.하지만 한계도 분명했다. 과거의 논문과 문헌 등을 고찰해 가장 타당한 답을 내놓는데는 확실한 성능을 보였지만 임상 의사의 판단에 들어가는 부분, 즉 의사 결정 구조와 지침 등의 반영에서는 한계가 나타났기 때문이다.즉 환자를 얼마나 입원시켜야 하는지, 또한 퇴원 시켜도 되는지, 얼마나 예후를 지켜봐야 하는지 등 임상 의사의 경험과 판단이 들어가는 부분과 그 나라 지침에는 맞는지 등에 대해서는 23.1% 전문의와 판단이 달랐다는 의미다.실제로 카테고리별로 정확도와 신뢰도를 비교하자 질병에 대한 기초지식과 생활습관, 임상적 진단과 치료 방식 결정에서 Chat GPT는 압도적인 성과를 보였다.하지만 예방의학과 예후 등의 측면에서는 50% 이상 올바른 데이터와 잘못된 데이터를 섞어서 내놓는다는 평가를 받으며 신뢰를 얻지 못했다.특히 세계적으로 통용되는 진단과 치료 등에는 매우 높은 정확도를 보였지만 각 국가별 가이드라인과 보험 정책 등을 적용해 최적의 결과를 내놓는데는 한계가 있었다.만약 미국에서는 간암 수술 후 5일은 입원해야 한다는 지침이 있고 한국에서는 3일이면 충분하다는 지침이 있다면 Chat GPT는 4일의 입원이 필요하다고 답한다는 의미가 된다.그러나 전문가들은 이 정도의 정확도와 신뢰도만으로도 Chat GPT의 활용성은 충분하다고 결론내렸다.궁극적으로 Chat GPT가 의사를 대체하는 역할이 아닌 만큼 보조적 역할로는 이미 현장에서 충분히 활용할 수 있다는 설명이다.알렉산더 박사는 "Chat GPT가 진단과 적절한 치료법, 관리 방법에 대해서는 전문의 못지 않은 정확도와 신뢰도를 보였다"며 "하지만 각 국가별로 가이드라인과 보험이 적용되는 범위, 적응증이 다르다는 점에서 이를 반영해야 하는 부분에서 한계가 나타났다"고 분석했다.그는 이어 "하지만 분명하게 Chat GPT는 지금 당장이라도 의사의 훌륭한 진단 및 치료 도구가 될 수 있다는 것을 보여줬다"며 "특히 환자들이 편하게 접근할 수 있다는 점에서 환자 대상 설명문과 각 의학 사이트 등을 대체할 수 있는 좋은 도구가 될 것"이라고 내다봤다.

2023-04-04 05:30:00의료기기·AI

의료 영역 챗GPT 활용성 찾아라…의학계 검증 착수

메디칼타임즈=최선 기자이용자와 실시간으로 대화가 가능한 대규모 인공지능 모델 ChatGPT(챗GPT)가 미국 의사국시를 통과하면서 의료 영역에서 실제 활용성을 검증하기 위한 작업이 본격화되고 있다.자의식이 없다는 점에서 그릇된 정보의 학습 가능성을 고려하면 엄중한 지식 및 판단이 필요한 의료 영역에서 그 활용성에 제한이 따를 수밖에 없기 때문.다양한 범위에 걸쳐 고품질의 연구 관련 질문을 생성, 연구자에게 참신한 아이디어를 제공하는 사례가 등장한 반면 엉터리 답변을 내놓은 사례도 등장하면서 전문가들은 챗GPT의 검증에 보다 오랜 시간이 필요하다는 데 무게를 실어주고 있다.2022년 11월 공개된 챗GPT는 대화형 인공지능 서비스로 사용자가 입력한 질문에 답하도록 설계된 언어모델이다.의학 논문검색 사이트 PubMed에 챗GPT 관련 연구가 첫 등장한 2022년 12월을 기점으로 총 141건의 논문이 등록됐다. 챗GPT의 등장이 4개월에 불과하다는 점에서 폭발적인 연구 증가는 의학계의 관심도를 나타내는 단면.초기 연구가 챗GPT의 소개 및 의학적 활용성 모색에 그쳤다면 최근 연구는 실제 임상 현장, 환경을 구현해 챗GPT가 적절한 반응을 나타내는지 확인하는 '검증' 영역에 접어들고 있다.의학 논문검색 사이트 PubMed의 챗GPT 관련 연구 등록 현황. 4개월간 141건이 등록됐다.이달 13일 공개된 연구(DOI: 10.1038/s41598-023-31412-2)는 챗GPT가 소화기내과에서 중요한 연구 질문을 도출해낼 수 있는지 평가했다.연구진은 위장병학(GI) 분야는 끊임없이 진화하고 있어 중요한 연구 질문을 정확히 집어내는 것이 중요하다는 점에 착안, 연구 우선순위를 식별하기 위한 평가에 착수했다.GI의 네 가지 핵심 주제인 염증성 대장 질환, 마이크로바이옴, 인공지능, 고급 내시경 등에 대해 챗GPT에 질의하고 경험이 풍부한 소화기 전문의로 구성된 패널이 생성된 연구 질문을 1~5 등급(높을수록 적절)으로 평가했다.전문가 패널의 평가 결과 챗GPT는 관련성이 있고 명확한 연구 질문을 생성했다는 판단이 나왔다.평균적으로 질문의 등급은 3.6±1.4 점이었으며, 관련성, 명확성, 특수성 및 독창성에 대한 평균 등급은 각각 4.9±0.1, 4.6±0.4, 3.1±0.2, 1.5±0.4점이었다. 패널들은 챗GPT가 연구 질문을 생성하는 데 명확하고 적절하지만 독창적이지는 않았다고 판단했다.연구진은 "이번 연구는 대규모 언어 모델이 GI 분야에서 연구 우선 순위를 식별하는 데 유용한 도구가 될 수 있지만 생성된 연구 질문의 참신성을 개선하기 위해 더 많은 작업이 필요하다는 것을 시사한다"고 가능성과 한계를 동시에 진단했다.챗GPT가 핵의학 문헌을 요약하거나 연구자의 글을 수정 및 개선하는 데 도움을 줄 수 있는지 판단한 연구(doi.org/10.1007/s00259-023-06172-w)도 지난달 공개됐다. 이번 연구에서 챗GPT는 다소 실망스런 결과를 내놓았다.연구진은 핵의학 필기 시험을 시뮬레이션하기 위해 챗GPT에게 50개의 4~5선다형 문제를 제공하고 정답 1개를 선택하도록 했다. 50개 사례 모두에서 챗GPT는 명확한 답을 제시했지만 답안과 대조한 결과 정확도는 34%(17/50)에 불과했다.이어 연구진은 문답 피드백 방식으로 챗GPT의 학습 능력 또는 수정 능력을 테스트했다. 틀린 대답을 내놓을 경우 다시 질문하는 방식으로 문제를 이어갔다."뼈 스캔에서 흡수량이 증가하지 않는 양성 병변은 무엇입니까?"라는 질문에 챗GPT는 유골종(osteoid osteoma)이라는 오답을 내놓았다. 다시 질문을 한 결과 이번엔 골관절염이라는 엉뚱한 대답을 내놓았다.연구진은 "같은 질문을 하면 다른 답이 나타날 수 있고 몰랐거나 대답할 수 없다고 말하는 대신 챗GPT는 피상적이고 설득력 있는 답변을 제공했는데 이는 잘못된 것"이라며 "특히 이같은 행위는 스캔 결과를 해석하는 데 해로울 수 있다"고 지적했다.연구진은 "AI 모델은 높은 신뢰도로 잘못된 출력을 생성하기 위해 (답변을) 속일 수 있으며 현재 동료 검토자를 속일 수 있는 겉으로 보기에 설득력 있는 콘텐츠를 제공할 수 있다"며 "이번 예비 분석은 현재 표준화된 시험의 환경에서 챗GPT가 핵의학 의사가 기대하는 지식을 입증하는 것과는 거리가 멀다는 것을 시사한다"고 덧붙였다.이달 4일 공개된 연구(DOI: 10.1007/s†16-023-01925-4)는 임상 실무 지원 및 의약품 연구, 공중보건 주제에 대한 추론에 걸쳐 챗GPT의 가능성을 평가했다.연구진은 챗GPT와 같은 AI 기반 언어 모델이 인상적인 능력을 입증했지만, 높은 수준의 복잡한 사고가 필요한 의료 분야에서 얼마나 기능을 잘 수행할지는 미지수라며 그 타당성을 조사했다.먼저 과학 글쓰기 영역에서 챗GPT에 2022년 12월 NEJM에 발표된 논문 5편을 요약해달라고 한 결과 전반적으로 올바른 결과값을 내놓았다.이어 공중보건에 대한 토픽에서 연구진은 챗GPT에 생물학적 관점에서 고령자의 연령을 객관적으로 측정할 지표를 물었고 이에 챗GPT는 치아 및 골격 발달, 텔로미어 길이, DNA 메틸화, 호르몬 수준, 인지 기능을 포함해 일반적으로 연구되는 방법들의 목록을 즉시 제공했다.연구진은 "챗GPT는 문헌 탐색과 새 연구 가설 수립, 복잡한 데이터 처리에 유용할 수 있다"며 "또 전자 건강 기록(EHR), 임상 노트 및 연구 논문과 같은 의료 텍스트에서 유용한 정보를 추출하는 데도 도움이 될 수 있고 복잡한 연구를 일반 대중이 이해하기 쉬운 언어로 번역함으로써 과학적 발견의 보급을 촉진할 수 있다"고 결론내렸다.이어 "다만 챗GPT의 한계와 능력을 이해해야 한다"며 "정확한 답변은 신뢰할 수 있는 것처럼 들리지만 부정확하거나 비논리적인 언어를 생성하는 챗GPT의 능력도 포함되고, 또 다른 큰 문제는 챗GPT가 훈련 받은 데이터에 존재하는 편견을 재현할 수 있다는 것"이라고 덧붙였다.챗GPT를 연구 강의 자료 생성에 활용해 본 김병욱 대한상부위장관·헬리코박터학회 총무이사 역시 비슷한 의견이다.그는 "챗GPT는 사람들이 기대하는 것처럼 기존의 연구를 토대로 새로운 내용의 임상 논문을 쓰거나 새로운 개념, 아젠다를 제시할 정도의 성능은 아니었다"며 "강의 자료 요약하는 부분에서 활용할 부분이 있다는 생각이 들었을 뿐 챗GPT가 창의적으로 기존 문제들을 해결해 줄 돌파구라는 기대감은 과하다"고 덧붙였다.

2023-03-22 11:53:22학술

의사 시험까지 합격한 chatGPT "과한 기대는 금물"

메디칼타임즈=최선 기자최근 인공지능 챗봇 chatGPT가 미국 로스쿨 시험에 이어 미국 의사면허 시험을 통과하면서 의료 영역에서의 활용성에 기대감이 커지고 있다.최신 연구에서 chatGPT는 인지력 저하를 겪고 있는 사람의 음성 분석을 통해 알츠하이머 환자를 80% 식별하는 등 실제 그 잠재력을 보이고 있기 때문.`이를 활용해본 의료진들은 AI가 학습에 기초한다는 점, 의료용으로 고도화되고 체계화된 학습훈련을 받지 못했다는 점에서 현 시점에서의 가능성 진단은 이르다는 평이다.2022년 11월 공개된 chatGPT는 대화형 인공지능 서비스로 사용자가 입력한 질문에 답하도록 설계된 언어모델이다.chatGPT 접속 화면인터넷 등에서 학습한 자료를 토대로 가령 특정 가수의 스타일로 가사를 작사해달라는 요청이나 특정 논문을 3장으로 요약해달라는 사용자의 요청에 반응한다.의료 영역에서의 활용성에 기대감을 키운 것은 지난 달 chatGPT이 미국 의사 면허 시험(USMLE)에 통과하면서부터(doi.org/10.1101/2022.12.19.22283643).해당 시험에서 연구원들은 이론적인 환자의 징후와 증상을 주고 원인이나 진단이 무엇인지 판단토록 했다.이어 의학 시험 문제를 제공하고 답변을 선택하도록 한 이후 정답 선택의 이유와 오답이 오답인 이유를 설명해 달라고 요청한 결과 50% 이상의 정확성으로 시험을 통과했다.알츠하이머 환자 식별에 대한 chatGPT의 활용 가능성을 진단한 연구도 진행됐다.미국 필라델피아 대렉셀대 연구진은 chatGPT를 사용해 건강한 성인과 알츠하이머 환자의 음성을 학습시켜 인지력 저하를 겪고 있는 사람의 정규 언어와 음성 사이의 미묘한 차이를 식별토록 했다. 그 결과 약 80%의 정확도록 알츠하이머 환자를 식별할 수 있게 됐다.이미 인간의 언어 형태로 질문해도 이에 답할 수 있는 인공지능 IBM 왓슨이 상용화돼, 일선 병원에서 활용되고 있는 만큼 chatGPT도 임상적 활용성이 높다는 것. 실제 chatGPT를 활용해본 의사들의 반응은 어떨까.대한상부위장관·헬리코박터학회는 학회 산하 AI연구회 및 빅데이터연구회를 운용중이다.김병욱 총무이사는 "chatGPT를 의료 쪽에서 활용해보고자 하는 시도가 빈번해지고 있다"며 "대한상부위장관·헬리코박터학회도 AI 활용에 관심을 갖고 있지만 학회의 관심사는 건강보험, 심평원 빅데이터 활용이나 인공지능 영상 검진 등 보다 실질적인 부분에 초점을 맞추고 있다"고 말했다.그는 "chatGPT가 논문을 요약하거나 정리해준다는 말도 있어 최근 실제 활용성을 진단해 봤다"며 "헬리코박터 제균 요법에 대한 미해결 과제를 중심으로 chatGPT가 어떤 대답을 내놓는지 테스트했다"고 밝혔다.그는 "chatGPT는 학습을 기반으로 하기 때문에 테스트에선 이미 알려진 내용을 요약해주는 정도에 그쳤다"며 "사람들이 기대하는 것처럼 기존의 연구를 학습해 새로운 내용의 임상 논문을 쓰거나 새로운 개념, 아젠다를 제시할 정도의 성능은 아니었다"고 설명했다.대학가에서 과제 제출용으로 chatGPT를 악용하는 사례가 보고되는 것처럼 이미 알려진 내용의 정리, 요약엔 강점이 있지만 충분히 학습되지 않거나 의학 분과 학문처럼 전문적인 부분에선 활용도가 떨어진다는 것이 그의 판단.김 이사는 "헬리코박터 제균 치료의 문제점으로 항생제 내성이 꼽히고 이를 해결하기 위한 방법론으로 4제 처방이나 제균 기간 증가, 최신 P-CAB 활용 방안 등이 있다"며 "chatGPT가 제시한 문제 해결방안에는 이런 내용들이 전혀 없었다"고 말했다.그는 "강의 자료 요약하는 부분에서 chatGPT를 사용할 수 있다는 생각이 들었을 뿐 chatGPT가 창의적으로 기존 문제들을 해결해 줄 돌파구라는 기대감은 과하다"며 "나온지 몇 개월에 불과해 학습이 충분치 않기 때문에 현 시점에서 그 잠재력을 예단하는 것은 섣부르다"고 덧붙였다.

2023-02-23 05:30:00학술

1

기간별 검색 부터 까지

섹션별 검색 전체 정책 병·의원 제약·바이오 의료기기·AI 학술 오피니언

기자 검색

선택 초기화

이메일 무단수집 거부

메디칼타임즈 홈페이지에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 방법을 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반할 시에는 정보통신망법에 의해 형사 처벌될 수 있습니다.